达梦数据库到底是不是全部源代码自主知识产权?
新粉请关注我的公众号
自从上篇文章“估值500亿!中国数据库第一股准备上市!!”发出来以后,我的读者们一直都有一个质疑:达梦数据库到底是不是100%源代码自主知识产权。
换个说法,达梦数据库的代码是不是都自己写的,还是说参考借鉴了某个版本的开源数据库?
这个问题我花了一些时间做了调查,结论呢也不是很确定。但是我会尽力把我知道的写下来。
坦白说,我本人没有用过达梦数据库,达梦数据库也不会敞开源代码给我去看,所以我无论如何是没办法知道真相的。
首先网上有一篇达梦数据库技术总监黄海明2018年5月10日在第九届中国数据库技术大会DTCC现场演讲内容的整理。
这算是官方给出来的一个说法:达梦数据库从上世纪80年代开始一直走自研的道路,既没有基于开源,也没有第三方授权的非开源源代码。
当然,那篇文章介绍了很多达梦数据库的技术发展,从开局一个单机版,到主备架构,到读写分离,然后到大数据和MPP架构等等。总之就是凡是主流的架构,达梦数据库可能会迟到,但是从来都没有缺席过。纯自由,100%自主知识产权源代码。
这篇文章里面还提到了一件事情,2017年底,国家组织了一个豪华阵容的专家团队对达梦数据库源代码进行了对比审核,据说这个黑鸭子软件有2TB的开源代码。经过对比达梦99.9%以上的代码是自主研发的。至于这剩下的0.1%到底是什么,我也不知道。
当然,扒到的也不仅仅只有这个说法。在某个大牛云集的地方,大家也讨论过达梦数据库,一个说法是它们数据库是基于某个很早期的PG版本魔改的。由于自己基于某个很早期的PG版本魔改,后续PG新版本上来以后再想把PG的新版合并回来就比较困难了。
你要问我哪个版本是真的,哪个版本是假的,那我个人的倾向还是在没有证明达梦的人是说谎之前,我还是先相信他们说的是真话比较好。
毕竟,如果他们自己都发誓是全是自研,自主知识产权的,那么我们也没道理去怀疑这是另外一个汉芯的故事对吧?无条件的线怀疑人,总是不太好的态度。
所以,我个人还是先倾向于相信达梦的确是全部自研,自主知识产权的产品。
当然,如果确实是PG改的,那么真的使用达梦的人,用久了其实也是很容易发现的。毕竟PG的基因决定了基于它的数据库总有某一些特征是改不掉的。
但是目前我在网上看到达梦是PG改的,并且能够展示出来比较信服的证据,我还是真的没看到。这让我想起了另外一家自己说自己也是全自研,但是很多证据都揭示是基于PG改的公司,两个一对比,目前来说,我也很难说达梦不是自研。
所以,你要问我怎么看这个问题,在没有足够强有力的证据推翻这个结论之前,我还是相信达梦是自研的,拥有自主知识产品的产品。